Проектът LatticeFlow е впечатляващ не само защото решава фундаментални проблеми в системите с изкуствен интелект (ИИ). Той е и първата високотехнологична компания, която се позиционира до института INSAIT и ще работи в тясна връзка с него. Дори без официален рунд за финансиране стартъпът набра 12 милиона долара, част от които ще инвестира в наемането на специалисти в София.
LatticeFlow спечели наградата за най-иновативна ИИ компания в Швейцария, приза в тази област на американската армия и се нареди сред топ 100 компании за ИИ в света. Попадна сред 10-те швейцарски начинания, които си струва да се следят през 2023-а.
Технология на стартъпа е разработена в университета ETH в Цюрих, преди да се отдели в компания, начело с д-р Петър Цанков, проф. Мартин Вечев и техните колеги д-р Павол Биелик и проф. Андреас Краузе. Българските учени вече имат опит в предприемачеството с няколко успешно продадени високотехнологични компании зад гърба си.
Д-р Петър Цанков ще участва в тазгодишното издание на конференцията Digitalk на 18 май в Sofia Event Center.
Срещаме се с него, за да поговорим за това как се създава стартъп в област, която тепърва започва да се обособява. Как разработените от екипа алгоритми помагат за създаването на ново поколение надежден ИИ в редица приложения. За огромните перспективи в тази област, откриващи се пред екипа, който вече работи в София.
– Напоследък, заради ChatGPT и GPT-4, всички погледи се насочиха към темата за изкуствения интелект. С какво се оказаха толкова значими тези модели?
– ChatGPT е първият масов модел за изкуствен интелект: за 5 дни надмина 1 милион потребители, за 2 месеца надмина 100 милиона, а днес вече се използва от над 1 милиард души по целия свят. Подобен растеж е невиждан. От техническа гледна точка ChatGPT не бележи фундаментален напредък: той е GPT-3 модел, дообучен да предоставя тези отговори, които са предпочитани от хората.
– Имат ли те шанса да променят бизнес сектора?
– Да, неизбежно е. Това, което не е очевидно, е, че тези модели всъщност няма директно да променят индустриите около нас.
Тези модели не се справят достатъчно точно и надеждно в практически нито една бизнес сфера.
Например, няма трябва да използваме ChatGPT за финансови съвети или диагностициране на болести. Последните научни резултати показаха, че в 75% от приложенията ChatGPT отстъпва на „специализираните“ модели, които са обучени да решават проблеми в медицината, финансите и други индустрии. Именно затова на GPT-X моделите им казваме „базови“ – те предоставят добра основа, но изискват да бъдат дообучени на качествени данни и примери, за да се използват в индустрията.
– Огромният интерес към темата днес може ли да ѝ изиграе лоша шега – след подобни пикове, всяка технология минава и през спад или зима. Смяташ ли, че е възможно да се случи нещо подобно и тук?
– Не. Темата за изкуствения интелект се развива от 1950 г. и вече премина през две зими – през 80-те и 90-те. Днес технологията е в процес на масово навлизане във всяка една индустрия и всеки един дом.
Светът ще изглежда доста различно през следващите години, няма връщане назад.
Новото при изкуствения интелект е скоростта на развитие на технологията, което според мен ще разкрие редица неизвестни. И ще изненада дори експертите.
– 1100 учени и предприемачи, сред които Стив Возняк и Илън Мъск, се опитаха да спрат създаването на нови модели за изкуствен интелект за 6 месеца. Необходимо ли е това?
– Не. Невъзможно е да се спре развитието на тази технология и подобен ход само ще доведе до намалена прозрачност и създаване на модели зад затворени врати, което ще открие далеч по-сериозни рискове за нас. Това, което можем да направим, е да засилим напредъка в сигурността и надеждността на тези модели. Това е именно проблемът, по който аз и хората в LatticeFlow, ETH и INSAIT работим усилено вече над 7 години.
– Как LatticeFlow успя да напреднето толкова бързо? И защо решихте да продължите да се развивате в София?
– Успехът на компанията се дължи на уникалността на нашата технология, която предоставя практически безкраен бизнес потенциал в тази бързо разрастваща се сфера, и доказания интерес от технологични гиганти като Siemens и правителствени организации като американската армия. Стартирахме компанията през 2021 г. с първоначалното финансиране от $2,8 млн., а в края на 2022-а добавихме още 12 млн., за да ускорим развитието и да разраснем екипа в София.
Развиването на високотехнологични продукти като LatticeFlow изисква не само бизнес и продуктови екипи, но и тясна колаборация с научни екипи от световно ниво. INSAIT създаде възможността на компании като LatticeFlow да се развиват в София. Ние имаме такава колаборация с ETH в Цюрих, където разработихме първоначалната технология и сега ще приложим този модел в София.
Той се използва във всеки високотехнологичен център по света. Трябва да се покаже, че той работи в България. Това е
единственият начин, по който нашата IT индустрия може да скочи на следващо ниво,
където не само се разработват, но и измислят продукти, където има силни кадри, които да привлекат големите технологични гиганти като Google, Apple, Microsoft и Amazon.
За да ни има на картата на изкуствения интелект, не е достатъчно да разбираме как работи тази технология, а трябва да се работи по нейното ново поколение и да се публикуват научни статии на световните подиуми по темата като ICML и NeurIPS.
– Как се роди идеята за подобен стартъп?
– Всичко започна със създаването на първия метод за проверка на безопасността и надеждността на дълбоките невронни мрежи. Проф. Вечев ме насочи да прочета един нов резултат на изследователи от Станфорд и Оксфорд, които разработиха метод за валидиране на невронни мрежи. Въпреки че методът е интересен, ставаше ясно, че той работи само при непрактично малки модели за ИИ.
Бързо стигнахме до „аха момент“, като осъзнахме как можем значително да скалираме тази концепция и да валидираме огромните модели за изкуствен интелект – тези, които индустрията иска да използва на практика. Обсъдихме идеята и още същия ден започнахме работа, като включихме в проекта и докторанти от екипа на проф. Вечев.
За няколко дни разработихме прототип, след това дойдоха и първите резултати. Научната статия представихме на IEEE Oakland Security & Privacy, най-престижната конференция за сигурност в света, последваха още 40-50 научни резултата на световно ниво. Това превърна ЕТН Цюрих в основен център за сигурен и надежден изкуствен интелект, което предизвика силен интерес в индустрията и задвижи нашите бизнес контакти в тази сфера. Важно беше да се действа бързо, защото беше очевидно, че това е важна тема, по която се работи усилено.
Състезаваш се със стотици хиляди учени по целия свят. Надпреварата е жестока.
– Определено! ChatGPT, разпознаването на лица, генерирането на изображения, чудесата в тази област са все повече…
– Приложенията стават все повече, а компаниите все по-активно разработват модели, за да решават реални проблеми. Това се ускори още повече с навлизането на генеративните модели за текст и изображения. Фундаменталните проблеми около създаването на надежден и сигурен изкуствен интелект за индустриите остават – тези модели трябва не само да работят добре в лабораторни условия, но и да се справят надеждно при решаването на реални проблеми в медицината, финансите, производството.
Въпреки че знаем как да тренираме модели, които постигат добра точност на тестови данни,
нещата не са толкова розови, ако ги приложим на нови примери от реалния живот.
Създаването на нови модели, които работят надеждно, изисква правилно подбрани и описани данни за обучение. Моделите да се дообучат и коригират, ако не работят добре в определени ситуации. Да се забелязват нови явления, които не са срещани при обучаването и редица други сложни проблеми.
– Например?
– Ето един проблем от практиката – модел, който разпознава рак на кожата. На повечето снимки, при които пациентът има рак, има маркировки от хирургичен химикал, които се поставят, за да се измери големината на бенката и да се следи нейното нарастване. Тази подвеждаща корелация между наличието на хирургични маркери и рак на кожата заблуждава модела! Вместо да научи как да разпознава болестта, той научава, че наличието на хирургични маркери е показател, че дадена бенка е ракова.
– Какви решения дава в тази посока LatticeFlow?
– Нашата платформа автоматично намира тези пропуски в знанията на изкуствения интелект и позволява тяхното поправяне, преди да доведат до проблеми. Важно е да се отбележи, че подобни отклонения няма как да бъдат открити без автоматизация, тъй като се работи с огромни масиви от данни и сложни математически модели. Именно затова ние автоматизираме процеса.
Първият ни продукт автоматично „диагностицира“ данните, за да открие проблеми с тяхното качество. Той позволява бързо, ефективно и лесно да се намират и отстраняват проблеми, свързани с анотациите на данните, липсата на данни от определени ситуации, премахването на подвеждащи корелации и други.
Вторият ни продукт автоматично намира в кои ситуации моделът не работи добре. Например, въпреки че даден модел за разпознаване на рак на кожата се справя средно с над 90% точност, на част от данните тя може да падне значително, например под 30%.
Нашият продукт намира слепите петна на моделите – местата, където е най-големият риск да сгрешат.
– Всичко това после се коригира ръчно, така ли?
– Специалистът който разработва модела, избира каква корекция да се приложи, но самата корекция се изпълнява автоматично върху целия масив от данни. Това е важно, защото ръчното коригиране на такива проблеми е трудно и скъпо. Например, ако данните систематично са грешно маркирани, е непрактично специалистът да ги коригира пример по пример, това би отнело месеци. Нашият продукт автоматично показва кои данни са маркирани грешно и прилага нужната корекция. Така вместо месеци и стотици хиляди долари, тя отнема 1-2 минути.
– Четох, че сред клиентите ви вече са американската армия, германското бюро за федерална сигурност, огромни компании като Siemens…
– Да, всяка компания и държавна организация, която прилага модели за изкуствен интелект, има нужда от нашата платформа. Имаме клиенти от различни индустрии. Сред тях са основните лидери в автоматичното инспектиране на щети по автомобилите, които предлагат тези продукти в застрахователната сфера. Работим и с лидера в сферата на изкуствения интелект за автоматизиран анализ на спортни игри като футбол, баскетбол, бейзбол, и други. При всички тези клиенти нашата платформа е ключова, за да се създадат модели, които работят надеждно.
– Как се стигна до привличането на средства… без дори да сте ги търсили?
– Инвеститорите ни намериха, преди официално да търсим инвестиция. Бях в САЩ, споделях как се развиват продуктът и неговото търсене. Инвеститорът, който впоследствие поведе рунда, осъзна, че има силно търсене за нашия продукт на пазара и че ни липсват достатъчно технически кадри, които да работят с клиентите ни. Поради тази липса
попаднахме в ситуацията да отказваме на компании от топ 100 на Fortune списъка,
защото се налагаше инженерите, които разработват продукта, да се включват и да помагат за интегрирането на нови клиенти. Така стигнахме до момента, в който изпреварихме нормалния ход на финансиране и получихме преждевременно нови 12 милиона долара, за да ускорим нашето развитие.
– Какви хора ще търсите в България?
– Планът е да сме 40 до края на тази година. Търсим хора за всякакви позиции – продуктови дизайнери, продуктови мениджъри, технически продажби, маркетинг.
– В кои посоки на ИИ виждаш скоро най-големите пробиви?
– Виждаме приложенията във все по-неочаквани сфери, което е знаково за широкото навлизане на тези технологии около нас.
Говорим дори за компании, които правят паркет, и тренират модели, с които да подреждат различните дървени плоскости автоматично.
Смятам, че до 2 години моделите за изкуствен интелект ще навлязат силно в нашето ежедневие. Все по-актуална става темата за безопасността им. В края на април тази година обявихме първата услуга за валидиране на безопасността и надеждността на изкуствения интелект и започнахме първите проверки на модели, използвани в големите швейцарски банки. Тази услуга позволява валидирането на моделите спрямо регулациите и стандартите, които се разработват от Европейския съюз и САЩ.
Нашата мисия е да помогнем на компаниите да създават ново поколение надежден изкуствен интелект, което ще позволи широкото приложение на тези технологии.
Потенциалът да се превърнем в световен лидер в тази важна сфера е практически безкраен.
Именно затова искаме да създадем нещо наистина значимо и голямо!
– Може ли проектът ви да се използва и от технологии като нашумелите модели на OpenAI? С какво би могъл да е полезен там?
– Да. Моделите на OpenAI, както и техните алтернативи с отворен код, се дообучават на нов набор от данни от компаниите, за да се приложат в индустрията. Те предоставят добра база за създаването на специализирани модели, експерти по конкретни проблеми в индустрията. Освен това нашият продукт използва тези базови модели, за да работи по-ефективно, например да дава обяснения защо моделът не работи в дадени ситуации.
– Къде минава пределът на възможностите на този тип технологии?
– Важно е да се разбере, че тези модели представляват по-умен софтуер, с който можем да решим широк набор от проблеми. На този етап ние имаме контрол върху технологията. Това не означава, че можем да си позволим да я подценим. Напротив, вярвам че този „по-умен“ софтуер фундаментално ще промени света около нас.
– От 20 години пиша за наука и се срещам с учени. И все още ми е много странно да говоря с изследовател като теб за милиарди, за бизнес… Много различна е тази парадигма.
– Това е нормално за учените, които работят във високотехнологични центрове като Станфорд и ЕТН Цюрих, където научните изследвания систематично се превръщат в компании за милиарди долари. По време на финансирането например говорих с проф. Кристофър Манинг от Станфорд. Той е един от най-известните експерти в света в сферата на обработката на естествени езици. Неочаквано за мен той се включи в разговорите с един от инвеститорите ни, за да им помогне в проучването на LatticeFlow. Вместо да ми зададе технически въпроси, както очаквах, той се интересуваше от клиентите, пазара, цикъла на развитие…
– С какво се отличават българите, работещи в областта на ИИ?
– У нас има сериозна култура за изучаване на точни науки като математика, физика, информатика. Смятам, че това се случва благодарение на силните гимназии и учители в тези сфери, които обучават подготвени кадри.
За съжаление, ситуацията е различна, когато говорим за образование след гимназията, затова голяма част от тези умове избират да създават наука извън България. Така, въпреки че имаме силни технически екипи за разработване на продукти, нямаме достатъчно кадри, които да измислят по какви продукти да се работи.
Това важи особено в нови сфери като ИИ – на практика България не съществува на световната карта на този тип технологии. Нямаме разработки и резултати в световно признатите конференции по тези теми.
Според мен обаче България има отлични предпоставки, за да се превърне във високотехнологичен център. Смятам, че манталитетът на предприемачите в Източна Европа е по-близък до американския – мисли се мащабно, без ограничение, с повече риск и смелост.
Виждам хората, които създават компании тук, те искат да превземат света. Много ми харесва този манталитет!
Освен това имаме ниски данъци, които са изключително примамливи за развиването на бизнес. Сега имаме и INSAIT, който привлича учени от световно ниво. Не виждам причина с едно добро развитие да не подминем значително Запада в тези сфери, както направиха Сингапур, Швейцария, и Израел.